El test Drill-Down y Fabricate (DDFT): Un protocolo para medir la robustez epistémica en modelos de lenguaje
Metodología para medir la robustez epistémica en modelos de lenguaje mediante técnicas de análisis y evaluación. Descubre cómo evaluar la fiabilidad y consistencia de los modelos lingüísticos.